UNIX MAGAZINE 1996年6月号

キーフレーズ

UNIX MAGAZINE SCSI 000 ネットワーク monkey Windows -3 HTML クライアント 1996 システム -2 マルチキャスト スレッド CORBA オプジェクト Netscape インターフェイス 対応 プログラム inetd ファイル 利用 サーバー インターネット アプリケーション 機能 ウインドウ FAX コマンド アクセス SPARCstation 場合 and () -1 lnternet サポート パスワード SPARC Ethernet 登録商標 指定 Wide CPU 可能 xinetd 価格 データ Sun 処理 Windows 95 public 2GB for シリーズ ORB Solaris Java できる ホスト sum TCP/IP Windows NT ソフトウェア TCP Macintosh 接続 Base サービス イメージ アドレス 4GB データグラム 表示 Message 必要 テキスト -4 http:// DEC CALL 製品 NIS Subject MHz 実行 開発 使っ ルータ アプレット Fast オプション ツール 日本語

目次

連載 /lnside DVI → PS \documentstyle{j—article} \begin{document} %html test . html 1 \end{document} プルクオート ) で囲み、指定したタグの開始部分と終了 ドを使って変換します。コマンドは、、 指定した HTML ファイルのタグを、 I*TbX のコマン 列 " " 終了ハコマンド列 " ・ /ohtml -d タグ名オプション " 開始コマンド と、リンクは INIb,X の脚注になります。 文献として参照します。このオプションを指定しない 外部の HTML ファイルへのリンクを、の参考 ・ /ohtml —b を判断するために使います。 HTML ファイル中の URL がローカルかリモートか 入力ファイルのディレクトリを指定します。これは、 ・ /ohtml ーて U 月カ す。 book を指定した場合 ) または \section に変換しま とすると、 HI タグを \chapter ( 文書スタイルとして %html f00 . tex 1 深さを整数て指定します。たとえば、 に取り込みます。、、レベル " では、ヘッダか変換される HTML ファイルを L\TEX ファイルに変換し、この行 ・ /ohtml HTML ファイル名レベル コメント行では、次のような言当か可能です。 部分に挿入します。 110 竟として変換したい場合に使います。 -verb : タグで囲まれた部分を、 L\TVfX の verbatim れます。 指定された、、開始 I*TEX コマンド列 " だけカ咄力さ れた部分を取り除きたい場合に使います。このとき、 -off : 作成されるファイルから、タグで囲ま 利用しない場合に使います。 れた部分でイタリック体を指定する HTML タグを -lim : -math オプションを指定したとき、タクて悃ま して変換する場合に指定します。 -math : タグで囲まれた部分を数式 (math) モードと オフション " の部分では、次の指定か可能です。 -alltt : タグて悃まれた部分を I*TEX の a 翫 t 環境と して変換したい場合に使います。現点では、 -verb と動作は同しです。 -br: 、、開始 L\TEX コマンド列 " の直前に改行を挿入し ません。これは、 \newline など、空行を生成する とエラーになる L\TEX コマンドを指定するときに使 います。 ・ /ohtml -s スタイル名 使用する I のドキュメント・スタイルに合わせて指 定します。この指定にもとづいて、章や節などの I コマンドが出力されます。デフォルトでは article か則 提とされています。これ以外に、 book と plain カ甘旨定 できます。 plain では、章番号などを省略するために \section の代わりに \section* を使います。 ・ %html ー 1 U 月カ 7 U. 月カ 2 HTML ファイル中の U 月カノを U. 月ん 2 にシンポリッ ク・リンクします。 ・ /ohtml —m 相対 URL 糸色対 URL 相対 URL を絶対 URL に変換します。 ・ /ohtml —i U ん HTML ファイルに含まれる U. 召力を無視します。 変手吉果 文字コードに EUC を使うと、日本語を含む HTML ファイルも処理できます。 タグについては、次のものがサポートされています。 HTML 、 HEAD 、 BODY 、 TITLE 、 ADDRESS 、 HI 、 H2 、 H3 、 H4 、 H5 、 H6 、 P 、 BR 、 HR 、 B 、 I 、 U 、 TT 、 EM 、 STRONG 、 UL 、 OL 、 DL 、 DT 、 DD 、 LI 、 LH 、 SELECT 、 MENU 、 DIR 、 BLOCKQUOTE 、 BQ 、 Q 、 CODE 、 SAMP 、 KBD 、 VAR 、 DFN 、 CITE 、 LISTING 、 PRE 、 XMP 未対応のタグは削除されます。 CENTER タグはサポ ートされていますが、段落を指定する P タグに対する LEFT 、 CENTER 、 RIGHT などの属性は処理されま せん。 UNIX MAGAZINE 1996.6

連載 /lnside DVI → PS—@ 文字コードに EUC を使うと、日本語を含む HTML ファイルも処理できます。ただし、文書の知頁の文書スタ イル指定を、、 article" ではなく、 jarticle" ( アスキー日 本語の場または、、 j-article" (NTT jIbX の場 合 ) にしたほうがいいでしよう。それには、さきほど紹介 した一。オプションを使います。 特殊フォントへの対応は、タグの言己こ用いられる & > をサポートしている程度です。日本語の HTML 文書ではこれ以外の Latin 1 文字を使うことは あまりないので、この点はそれはど間題はないかもしれま せん。 タグについては、次のものがサポートされています。 TITLE 、 HI 、 H2 、 H3 、 H4 、 H5 、 H6 、 UL 、 OL 、 DL 、 DT 、 DD 、 LI 、 B 、 I 、 U 、 EM 、 STRONG 、 CODE 、 SAMP 、 KBD 、 VAR 、 DFN 、 CITE 、 LISTING これら以タ ) タグがあると削除されます。上の一覧から も分かるように未対応のタグが多いので、たとえはサポー トされていない DIR タグか削除さ LI タグはそのまま 処理されて I*TEX でエラーになるといった現象カ起こり ます。これ以外に、日本語が含まれている HTML ドキュ メントでは、出力されたファイルで適切な改行がおこなわ れす編集しにくくなる問題もあります。 コメント行は適切に処理されすに、出力された文書にそ のまま現れます。表やハイバーリンク、イメージの表小も サポートされていません。 ー。文字列 : 指定した文子列を、 \documentstyle の 直後に { 矼 ticle } の代わりに挿入します。たとえば、 次のように指定します。 % htm121atex ー 0 '{jarticle}' f00. tmI % htm121atex ー 0 ' [a4] {jarticle}' f00. html 変鰈果 htm12tex htm12tex は、 F. J. Faase が作成した HTML から I*TbX に変換する C プログラムです。現在の最新バー UNIX MAGAZINE 1996.6 ジョンは 2.20 です。 これは、次の URL から入手できます。 HTML tools http://wwwis.cs.utwente.nl:8080/faase/H/ htmltools. html 現時点では、 httpd のポート番号が変更されたため、 www.w3.org のリンクからは参照できません。もし、最 初に紹介したツールのページをクリックしても参照できな いときは、上の URL を直接入力してみてください。 コンパイル方法 上記のページの下のほうにソースコードへのリンクがあ ります。これを瓧 m12tex -22. c などの、、 . c " という拡張 子の付いたファイル名で保存し、次のようにコンパイルし ます。 % cc htm12tex—22. c ー 0 htm12tex フ。ション htm12tex には、下記のオフションがあります。 -i : バージョンなどの情報を表示します。 -w : バージョンなどの清報と警告を表示します。 -p : HTML ファイルに HTML タグがないときに指定 します。 -r U カ : プログラムを実行するディレクトリの URL を 指定します。このオプションは、ローカルのファイル を指す URL カ目対表示のときに必要になります。 -b : 参考文献一覧を作成します。このオプションカ甘旨定 されていない場合、外部の URL は脚注として表示され ます。 -cr : 拡張子、、 . ref " を付けて相互参照ファイルを生成し ます。 -d : デバッグ・メッセージを表示します。 使用方法 htm12tex の使用方法ははかのプログラムとすこし違 い、ファイルとして、 HTML ファイルではなくい kX コマンドを含むい T の、、スケルトン・ファイル " を指 定します。このファイルに次のような畤殊なコメント行を 用いて HTML ファイル名やオプションをしておく と、指定どおりに変換した結果を、、スケルトン・ファイル 名 . tex" という名前のファイルに出力します。 109

連載 /lnside DVI → PS—@ Converting HTML to other formats http://www.w3.org/pub/WWW/Tools/ htm12things. html このページでは、次の 4 不鶤頁の HTML → L\TEX ツー ルカ絲呂介されています。 1. Nathan Torkington カイ乍成した htm121atex 0.9c (C プログラム ) 2. Frans J. Faase カイ乍成した htm12tex (C プログラム ) 3. Jake Kesinger が作成した htmlatex. pl (perl スクリ プト ) 4. htm121atex. sed (sed スクリプト ) 今回は、これらに加えて石田茂さんが巧 . sources に投 稿した htm121atex 4. OC (C プログラム ) も含め、順番 に紹介していきます。似たような名前が多いので、混同し ないようにしてください。 htm121atex 0.9c htm121atex は、 Nathan Torkington が作成した HTML ファイルを I IEX ファイルに変換する c プログ ラムです。現在のバージョンは 0.9c です。 NCSA の Xmosaic と同し HTML パーサを利用し ているのかネ 7 徴です ( 彳幻の htm121atex 4. ()C より旧い バージョンをベースにしています ) 。このプログラムは、次 コンパイル方法 htm121atex. html http://www.w3.org/pub/WWW/Tools/ htm121atex(1) の URL から入手できます。 108 ンパイルできます。なお、 Makefile で定義されている ます。よく分からない場合は、なにも指定しなくてもコ ・ CFLAGS : Makefile に記述されているなかから選び ます。 ・ CC:cc や gcc など、使用する C コンパイラを指定し たものを選べばいいでしよう。 設定か記されているので、そのなかから自分の環竟に合っ を実行します。 Makefile にはコメントとしていろいろな MakefiIe の以下の変数を適切に設疋してから、 make XMOSAIC はソースコードのなかでは使われていない ようです。 ・ RANLIB : BSD 系の UNIX では、作成されたライプ ラリに対して ranlib コマンドを実行しなけれはなりま せん。しかし、 System V 系の UNIX ではその必要が ないので ranlib コマンドはありません。そこで、 BSD 系では ranlib を指定し、 System V 系ではダミーのコ マンドとして /bin/true または touch コマンドを指定 します。 使用方法 次のように実行すれば、 HTML ファイルを INIVfX ファ イルに変換できます。 % htm121atex f00. html このコマンドを実行すると、指定したファイル名の 拡張子の部分が、、 . html " のファイル ( 上の例では、、 f 。。 . html") カイ成さこれに変換結果カ咄力されます。複 数のファイルを指定することもできます。ファイルを指定 する代わりに標準入力を使いたい場合は、引数に、、一 " を指 定します。 オプション htm121atex には、次のオプションがあります。 UNIX MAGAZINE 1996.6 の直前に挿入します。 -f フッタ : 指定された、、フッタ " を \end{document} me Ⅱ t } の直後に挿入します。 ー五ヘッダ : 指定された、、ヘッダ" を \begin{docu- 成します。 -a 著者名 : 指定された、、著者名 " でタイトルページを作 ます。 -t 題名 : 指定された、、題名 " でタイトルページを作成し -s : 変換結果を標準出力に出力します。 -c : \tableofcontents を使って目次を作成します。 ページします。 -p : タイトルページや目次がある場合は、その直後で改 ョンを指定すると \section を使用します。 \section* を使うようになっていますが、このオプシ ーⅡ : 各章に番号を振ります。たとえば、デフォルトでは